草庐IT

c++ - std::string 和 UTF-8 编码的 unicode

全部标签

c# - 尽管以 UTF-8 编写 XML,但在 XmlElement 中转义 Unicode 字符串

对于给定的XmlElement,我需要能够将内部文本设置为Unicode字符串的转义版本,尽管文档最终以UTF-8编码。有什么办法可以实现吗?这是代码的简单版本:conststringtext="ñ";vardocument=newXmlDocument{PreserveWhitespace=true};varroot=document.CreateElement("root");root.InnerXml=text;document.AppendChild(root);varsettings=newXmlWriterSettings{Encoding=Encoding.UT

c - 在 c 中实现 xml 解析器

我正在考虑用c99构建一个简单的xml解析器,我想实现它的每一个细节只是为了学习目的,据我所知,最好的方法是实现一个树结构并将xml字符串标记为一个树结构,所以它看起来像我将有2个简单的结构,一个代表一个节点,一个代表一个属性,上面的设计有多糟糕?有什么改进建议吗? 最佳答案 撇开你选择的任务的复杂性不谈,你的数据结构乍一看不错,但在我看来有两三处错误:您不仅要考虑子节点,还要考虑共享同一父节点的兄弟节点没有必要将sttribute树变成二叉树。为简单起见,我只使用单链表。您需要考虑左括号和右括号之间的节点内容(除非您的节点结构已经

java - 使用 JAXB 从未编码的 java 对象获取 xml 元素名称

我的Java模型中的字段注释@XmlElement(name="xxx")。有没有办法以编程方式获取xml元素名称? 最佳答案 假设我们有注释实体@XmlRootElementpublicclassProduct{Stringname;@XmlElement(name="sss")publicvoidsetName(Stringname){this.name=name;}}下面的代码将使用javaReflectionAPI打印“sss”.这里'product'是Product类的一个对象importjava.lang.reflect

c - 如何使用 libxml c 库获取 XML 中的属性?

某项任务要求我解析一个XML文件并检查每个节点及其属性。我花了几周时间学习XML和XML解析。我什至在之前发布的与C中的LIBXML解析相关的问题的帮助下,基于这种理解,我在下面编写了这段代码。但是这段代码是有缺陷的,因为我没有达到目标。我想我弄乱了一些父子和sibling的概念。我从下面提到的XML文件中了解到的是:Profile是Root节点,Catalog是它的子节点,目录有child作为参数和参数有child作为目标并且所有目录节点都是彼此的sibling。Profile-->Catalog-->Parameter-->Target|->Catalog-->Parameter-

python - XML 中的错误编码符号

我正在尝试通过“请求”库使用python3.4从某些Web服务获取数据。我需要获取一个有效的xml字符串以使用“lxml”库进行解析。但出于某种原因,xml中的数据编码不正确:<?xmlversion="1.0"encoding="UTF-8"?><Response><Data><Company>...etc.使用以下代码:ssession=requests.Session()session.get(target_url)exml=session.post(target_url,data=__xml,headers=headers)pri

java - JAXB 如何编码可选或可为空的元素

我正在尝试编码一个可以为null的元素,在某些情况下根本不应该写在最终的XML中,在其他一些情况下我应该指定它可以为nillable。考虑下面的例子Whatever1Whatever2NotemptyWhatever3元素“sub2”是我遇到的麻烦。根据我的理解,我可以使用如下声明的Element类轻松实现前两种情况:@XmlAccessorType(XmlAccessType.FIELD)@XmlType(name="element",propOrder={"sub1","sub2",})publicclassElement{@XmlElement(required=true)pub

xml - BeautifulSoup 不使用 utf-8 以外的其他编码解析 xml

我可以读取所有以开头的xmls文件但我无法读取以开头的文件.具体来说,我有两个文件:xml_iso.xml:ToveJaniReminderxml-utf.xml:ToveJaniReminder使用以下代码我可以找到note对于带有utf-8的文件但我无法在其他编码的文件中找到它。我该如何解决?示例代码:importunittestfrombs4importBeautifulSoupasSoupclassTestEncoding(unittest.TestCase):deftest_iso(self):withopen('tests/xml-iso.xml','r')asf_in:x

xml - XSLT 上的 HTML 编码

我想将一些值从XML属性转换为带有实体的有效HTML。例如,XML中的字符串"olá"将从XSLT转换为"olá"我找不到任何xsl函数来执行此操作。有什么想法吗? 最佳答案 您可以在xsl:stylesheet元素中指定us-ascii编码。以下XSLT:olá-给出:olá-oláxsl:stylesheet中的xml方法给出与标准XML标题相同的结果。 关于xml-XSLT上的HTML编码,我们在StackOverflow上找到一个类似的问题:

ASP.NET - 给定编码 .resx 中的无效字符

我正在使用包含.resx文件的App_LocalResource文件夹向客户的网站添加多种语言。客户端的测试应用程序托管在没有外部Internet访问权限的服务器上,因此我必须remotedesktop到网站并手动复制通过Notepad所做的任何更改..到目前为止,我已经手动创建了一个App_LocalResource文件夹,创建了.resx文件并通过记事本复制了每个文件的源。我现在遇到解析器错误:ParserErrorMessage:Invalidcharacterinthegivenencoding.Line137:Line138:Line139:Mortàcandidatures

c# - 读取ISO 8859 1编码,用webclient下载xml流

我正在尝试进行基本的网络客户端调用,以获取用于WP7的帖子跟踪应用程序的xml流。它确实有效,我确实得到了xml,但问题是因为我住在瑞典,我们有特殊字符,如åöä等,对于这些字符,我只得到一个里面有问号的框。我想要获取的xml文件如下所示:1...所以编码是ISO-8859-1,我想这是我的问题。一直试图在论坛上阅读解决方案,有人说支持该格式,而有些则不支持:Readingiso-8859-1rssfeedC#WP7我一直在尝试向客户端添加不同的编码,但似乎无济于事,我的xml总是缺少特殊符号。然而,有一种奇怪的行为让我有点害怕,如果我添加了错误的跟踪号码,而不是数字放在特殊字符中,我